# coding:utf-8
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

import sys

# data 将忽略表头
data = pd.read_csv("C:\\Users\\ljb\\Desktop\\hour.csv",header=0)
# data = open("C:\\Users\\ljb\\Desktop\\hour.csv\\hour_noheader.csv","r")

# data.head() 输出表头和前4行
# data.describe() 分别对每个字段进行分析，包括:count(统计行数),mean(平均值),std(标准差),min,max,4位百分位数
# data.count 统计每个字段的总数，当然就是统计文件的总行数
# data.items 输入所有的字段，包括表头
# data.get("key") key:字段，输入这个字段的所有值，就是输出一列，并且还包含一个序号，一行有两个值:序号 key对应的value

"""
5 种主题风格：
darkgrid(灰色网格背景，默认),whitegrid(白色网格背景),dark(灰色背景),white(白色背景),ticks(坐标有刻度，白色背景)
"""
# sns.set(style="whitegrid",context="notebook")
# sns.set(style="ticks",context="notebook")
# sns.set(style="dark",context="notebook")
# sns.set(style="white",context="notebook")
sns.set(style="darkgrid",context="notebook")
# cols 中的index 要存在于文件中的表头
cols = [ "temp","atemp","cnt"]
# cols = [ "season","yr","temp","atemp","hum","windspeed","cnt" ]
# size 影响点对图打长和宽
# pairplot 画点对图，只需要数据和设置大小即可
sns.pairplot(data[cols],size=2.5)
plt.show()